4. 분해 시계열시계열은 추세요인, 계절요인, 순환요인, 불규칙요인 등으로 구성되며, 서로 복잡하게 혼합되어
하나의 시계열을 구성한다.
분해 시계열은 분석 목적에 따라 특정 요인만 분리해 분석하거나 제거하는 작업을 말한다.
(분해 시계열은 대부분 회귀분석과 사용한다.)
추세요인인구의 증가, 기술의 변화 등과 같은 요인에 의해 장기간 일정한 방향으로 상승 또는 하락하는 경향을 보이는 요인
급격한 충격이 없는 한 지속되는 특징이 있다.
순환요인정확한 알려진 요인이 없고, 주기가 일정하지 않은 변동을 순환요인이라고 한다.
보통 추세선을 따라 상하로 반복 우동하는 형태로 나타난다.
계절요인일정한 주기를 가지는 상하 반복의 규칙적인 변동을 계절요인이라고 한다.
요일마다 반복되는 주기, 월별, 분기별, 계절별 등 고정적인 주기에 따라 자료의 변동이 반복되는 모든 경우가
계절요인에 포함된다. 계절요인은 매년 같은 시기에 유사한 패턴으로 나타나므로 예측하기가 상대적으로 쉬우며,
순환요인보다 주기가 짧은 것이 특징이다.
불규칙요인위의 세 가지 요인으로 설명하지 못하는 오차에 해당하는 요인으로 어떠한 규칙성 없이 우연히 발생하는
예측 불가능한 변동이다. 불규칙요인이 많으면 신뢰성 있는 예측이 어려우며 천재지변, 질병 등과 같은
요인에 의해 발생하는 모든 변동이 불규칙요인에 포함된다.
시계열 분석 예시R datasets 패키지의 Nile 데이터를 사용(나일강의 연간 유입량 데이터)
> library(datasets)
> library(forecast)
> auto.arima(Nile)
Series: Nile
ARIMA(1,1,1)
Coefficients:
ar1 ma1
0.2544 -0.8741
s.e. 0.1194 0.0605
sigma^2 estimated as 20177: log likelihood=-630.63
AIC=1267.25 AICc=1267.51 BIC=1275.04
>
> result<-arima(Nile, order=c(1, 1, 1))
# 구축된 모형(result)로 미래 5년 예측
> pred<-forecast(result, h=5)
> pred
Point Forecast Lo 80 Hi 80 Lo 95 Hi 95
1971 816.1813 635.9909 996.3717 540.6039 1091.759
1972 835.5596 642.7830 1028.3363 540.7332 1130.386
1973 840.4889 643.5842 1037.3936 539.3492 1141.629
1974 841.7428 642.1115 1041.3741 536.4331 1147.053
1975 842.0617 640.0311 1044.0923 533.0826 1151.041
> plot(pred)